#소프트웨어 테스트

자카드: AI가 작성하고 사람이 검토하는 코드를 위한 프로그래밍 언어

자카드(Jacquard)는 AI가 작성하고 사람이 검토하는 코드를 안전하게 실행, 검토, 시뮬레이션하기 위해 개발된 연구용 프로그래밍 언어입니다. 이 언어는 코드의 부작용(Effect)과 불확실성을 언어 수준에서 명시하여, 개발자가 전체 코드를 읽지 않고도 AI 에이전트의 행동 양상과 안정성을 파악할 수 있게 돕는 것이 핵심입니다. 향후 코드 생성을 AI가 주도하는 환경에서 인간 검토자가 직면할 신뢰 문제를 해결하기 위한 혁신적인 접근법으로 평가받습니다.

프로그래밍 언어 AI 코드 생성 소프트웨어 테스트

Hacker News • 54일 전

IMP 8

AI 코딩 에이전트를 위한 나만의 TDD 스킬

현재 AI 에이전트는 학습 데이터의 한계로 인해 테스트 코드 작성에 매우 서툽니다. 하지만 켄트 벡(Kent Beck)의 정석적인 TDD 원칙과 '명세-인코딩-이행(Specify-Encode-Fulfill)' 루프 같은 명확한 가이드라인을 제공하면, AI도 논리적이고 의미 있는 테스트를 작성할 수 있습니다. 이 글은 AI가 스스로 테스트 설계 오류를 점검하게 하고 불필요한 코드 작성을 방지하는 실용적인 에이전트 활용법을 소시합니다.

코딩 에이전트 테스트 주도 개발 소프트웨어 테스트

Hacker News • 69일 전

IMP 7

AI 코딩 루프를 위한 정형 검증 게이트

AI가 코드를 대량 생성하는 시대에는 프롬프트로 모델의 행동을 통제하는 '행동적 게이트'만으로는 치명적인 보안 버그를 막기 어렵습니다. 이 글은 코드가 원하는 규칙을 위반하면 컴파일이나 테스트 자체가 실패하도록 구조를 짜는 '구조적 게이트(정형 검증)'를 제안하며, 이를 위해 Shen이라는 정적 타입 언어 기반의 'Shen-Backpressure' 도구를 소개합니다.

AI 코딩 에이전트 소프트웨어 테스트 정형 검증

The Decoder • 82일 전

IMP 9

모질라, AI 에이전트로 파이어폭스 미확인 취약점 271개 발견

모질라는 앤스로픽의 클로드(Claude) 모델을 활용한 자율형 AI(agentic AI) 파이프라인을 구축해 파이어폭스 150에서 271개의 미확인 보안 취약점을 찾아내고 수정했습니다. 기존 AI 모델들이 가짜 버그를 양산하는 문제를 해결하기 위해, 이번 시스템은 AI가 직접 테스트 케이스를 작성하고 실행하여 버그의 실제 존재 여부를 검증하는 방식을 도입했습니다. 이를 통해 최대 20년 된 고질적 취약점까지 발견되었으며, 모질라는 향후 모든 신규 코드에 이 파이프라인을 자동 적용할 계획입니다.

보안 취약점 에이전트 AI 모질라 파이어폭스

Hacker News • 116일 전

IMP 7

100개 이상의 클로드 에이전트 병렬 테스트 사례

이 글은 100개 이상의 AI 코딩 에이전트(Claude)를 병렬로 실행하여 대규모 엔드투엔드(E2E) 테스트를 수행하는 새로운 소프트웨어 테스트 방법론을 소개합니다. AI가 튜토리얼을 기반으로 자동으로 테스트 코드를 생성하고 실행, 디버깅, 수정하는 과정을 거치며, 이를 통해 테스트 자동화의 병목 현상을 해결할 수 있습니다. 개발 실무 관점에서 다수의 에이전트를 활용해 테스트 커버리지와 개발 효율성을 극대화하는 중요한 사례입니다.

코딩 에이전트 소프트웨어 테스트 클로드(Claude)